O(n^2)排序算法 3

选择排序不稳定，相同元素可能会变化，因此这三种不选择选择排序。

代码中，把执行一个赋值语句的时间粗略地计为单位时间。冒泡排序需要 3 个赋值操作temp存储临时变量，而插入排序只需要 1 个 a[j]=a[j+1]移动数据。时间比值：1：7。

最优方法：插入排序。

O(nlogn) 排序算法 3

方法：利用主元分区，每次分为左边小区，右边大区。直至区内只有一个元素之后，排序完成。

时间复杂度：分区每次右边都没有元素。就从 O(nlogn) 退化成了 O(n2)。

处理过程：是由上到下的，先分区，然后再处理子问题。

用户搜索的关键词，有很多可能都是重复的，散列表先记录次数。

用堆求 Top K 的方法，建立一个大小为 10 的小顶堆，遍历散列表，依次取出次数，若次数多>顶堆，则删除顶堆。遍历完成后得到top10。

然而10亿太大了。

哈希之后，将 10 亿条搜索关键词先通过哈希算法分到10个文件。在进行上述步骤，然后得到10x10个关键字。租后排序得到top10。

10 个接口访问日志文件，每个日志文件大小约 300MB，日志都是按照时间戳从小到大排序的

将这 10 个较小的日志文件，合并为 1 个日志文件，合并之后也是从小到大排序。

机器内存只有 1GB，你有什么好的解决思路，能“快速”地将这10 个日志文件合并吗？

每次从各个文件中取一条数据，在内存中根据数据时间戳构建一个最小堆，然后每次把最小值给写入新文件，同时将最小值来自的那个文件再出来一个数据，加入到最小堆中。这个空间复杂度为常数，但没能很好利用1g内存，而且磁盘单个读取比较慢，所以考虑每次读取一批数据，没了再从磁盘中取，时间复杂度还是一样O(n)。

年龄的范围最小 1 岁，最大不超过 120 岁；

遍历这 100 万用户，根据年龄将其划分到这 120 个桶里；

依次顺序遍历这 120 个桶中的元素。

数据范围小，我们划分为901个桶，桶内为分数相同的学生。

此时不需要在排序，而是只需要依次输出到数组即可，只需一次扫描操作，时间复杂度O(n)。

ps. 若考生分数有小数点后一位，则需要所有分数乘10，转为整数，再放进9010个桶内。

规律：比较两个号码a、b，若前几位a已经大于b，则后面不用看。
方法：先按照最后一位排序，再按照倒数第二位，以此类推。最后按照第一位来排序。11排序之后，手机号码有序。
时间复杂度：按照每一位排序，数字只有0-10，可以使用桶排序，时间复杂度可以做到 O(n)。排序的数据有 k 位，时间为O(k*n)。k不大的时候，近似为O(n)。